Desacoplamiento de la exploración y la optimización de políticas: búsqueda en árbol guiada por incertidumbre para exploración difícil
Desacoplamiento de exploración y optimización con búsqueda en árbol guiada por incertidumbre: mejora la eficiencia en problemas complejos